SoftJaccard : une mesure de similarité entre ensembles de chaînes de caratères pour l'unification d'entités nommées
نویسندگان
چکیده
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. SoftJaccard: une mesure de similarité entre ensembles de chaînes de caractères pour l’unification d’entités nommées Christine Largeron, Bernard Kaddour, Maria Fernandez
منابع مشابه
Segmentation hiérarchique des cartes topologiques
Résumé. Dans ce papier, nous présentons une nouvelle mesure de similarité pour la classification des référents de la carte auto-organisatrice qui sera réalisée à l’aide d’une nouvelle approche de classification hiérarchique. (1) La mesure de similarité est composée de deux termes : la distance de Ward pondérée et la distance euclidienne pondérée par la fonction de voisinage sur la carte topolog...
متن کاملUne mesure de similarité entre phrases basée sur des noyaux sémantiques
Résumé. Nous proposons une nouvelle approche pour le calcul de similarité sémantique entre phrases en utilisant les noyaux sémantiques qui les composent. Ces noyaux, sous la forme de triplets (sujet, verbe et objet) sont supposés porteurs de l’information des phrases dont ils sont extraits. Sur la base de la comparaison sémantique de noyaux, on extrait un ensemble d’indicateurs descriptifs. Nou...
متن کاملEstimation de similarité entre séquences de descripteurs à l'aide de machines à vecteurs supports
Les bases de données contenant des séquences multimédia se trouvent maintenant partout. Archives de l’INA, balladodiffusion (podcast), production et partage de vidéo font désormais partie de notre quotidien. Faire des recherches par le contenu dans ces bases où l’information est en flux est difficile, notamment à grande échelle. Une des questions fondamentales concerne la mesure de similarité e...
متن کاملAdaptation d'un système de reconnaissance d'entités nommées pour le français à l'anglais à moindre coût (Adapting a French Named Entity Recognition System to English with Minimal Costs) [in French]
RÉSUMÉ La portabilité entre les langues des systèmes de reconnaissance d’entités nommées est coûteuse en termes de temps et de connaissances linguistiques requises. L’adaptation des systèmes symboliques souffrent du coût de développement de nouveaux lexiques et de la mise à jour des règles contextuelles. D’un autre côté, l’adaptation des systèmes statistiques se heurtent au problème du coût de ...
متن کاملRecherche d'images par noyaux sur graphes de régions
Résumé. Dans le cadre de la recherche interactive d’images dans une base de données, nous nous intéressons à des mesures de similarité d’image qui permettent d’améliorer l’apprentissage et utilisables en temps réel lors de la recherche. Les images sont représentées sous la forme de graphes d’adjacence de régions floues. Pour comparer des graphes valués nous employons des noyaux de graphes s’app...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2009